查看原文
其他

太神奇了,NCBI序列批量下载小技巧

2016-12-07 大脸李小圆 微生物生态


我们在做系统发育或生信分析的时候,经常会使用数据库的序列作为参考。

下载单条序列简单不过,无非就是打开NCBI主页,选择数据库后输入AC号或GI号后直接下载。

但是如何大批量下载呢?实现这一目的通常办法是借助一些生物软件的检索功能,诸如:BioeditGeneiousMacVector等,但是这些软件的下载和学习有时也会花费很多时间。其实,NCBI自带的一些小工具即可轻松完成这一任务。


NCBI中序列批量下载方法1

    该方法适用于已知序列号且最好是序列号连续的大量FASTA格式序列下载,具体步骤如下:

1.登陆NCBI主页,下拉菜单中选择"Nucleotide"

2.如若想获得序列号为“FJ552695FJ552699”的所有序列,那么只需要在检索框中输入“FJ552695:FJ552699 [ACCN]”
后搜索;就会得到这两个序列之间的所有序列,如下图:


3.后点击右上角“Send to:”旁边的下拉菜单,选择“File”,然后Format选择选择"FASTA", Sort by选择"Accession"后点击“Creat File”选择保存路径即可。


NCBI中序列批量下载方法2

根据http://www.plob.org/2014/06/06/8251.html博客:

【絮语】

下载序列简单不过,无非就是联网NCBI主页,选择数据库后输入AC号或GI号后直接下载。但是如何大批量下载,而且下载的序列是指定的ACGI的呢?实现这一目的通常办法是借助一些生物软件的检索功能,诸如:BioeditGeneiousMacVector等。其实,NCBI自带的Batch Entrez 只需简单三步即可轻松完成这一任务。

【准备工作】

创建一个需要下载序列AC号的列表文件,每行一个独立的AC号,保存为文本文件:

【简要流程】

1. 打开网页,粘贴这个网址:http://www.ncbi.nlm.nih.gov/sites/batchentrez?


2. 点击浏览按钮,选择事先准备带AC号的文本文件后,点击“Retrieve”开始检索,数秒后即可返回检索的序列记录;


3. 点击检索到的序列记录“Retrieve recordsfor 48 UID(s)”即可,后面就是“Send to” 保存要下载的序列,后面的操作就不在赘述,详见前面一些相关教程。


4. Good luck!

 


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存